智能论文笔记

PanorAMS: Automatic Annotation for Detecting Objects in Urban Context

Inske Groenen , Stevan Rudinac , Marcel Worring

分类：计算机视觉

2022-08-30

全球城市可免费获得大量的地理参考全景图像，以及各种各样的城市物体上的位置和元数据的详细地图。它们提供了有关城市物体的潜在信息来源，但是对象检测的手动注释是昂贵，费力和困难的。我们可以利用这种多媒体来源自动注释街道级图像作为手动标签的廉价替代品吗？使用Panorams框架，我们引入了一种方法，以根据城市上下文信息自动生成全景图像的边界框注释。遵循这种方法，我们仅以快速自动的方式从开放数据源中获得了大规模的（尽管嘈杂，但都嘈杂，但对城市数据集进行了注释。该数据集涵盖了阿姆斯特丹市，其中包括771,299张全景图像中22个对象类别的1400万个嘈杂的边界框注释。对于许多对象，可以从地理空间元数据（例如建筑价值，功能和平均表面积）获得进一步的细粒度信息。这样的信息将很难（即使不是不可能）单独根据图像来获取。为了进行详细评估，我们引入了一个有效的众包协议，用于在全景图像中进行边界框注释，我们将其部署以获取147,075个地面真实对象注释，用于7,348张图像的子集，Panorams-clean数据集。对于我们的Panorams-Noisy数据集，我们对噪声以及不同类型的噪声如何影响图像分类和对象检测性能提供了广泛的分析。我们可以公开提供数据集，全景噪声和全景清洁，基准和工具。

translated by 谷歌翻译

逻辑回归是一种用于二进制分类的常用方法。研究人员通常具有多个二进制响应变量，并且同时分析是有益的，因为它可以深入了解响应变量之间的依赖性以及预测变量和响应之间的依赖性。此外，在这样的同时分析中，方程式可以相互借出强度，这可能会提高预测精度。在本文中，我们提出了同时二进制逻辑回归建模的旋律家族。在这个家族中，基于距离规则，在降低维度的欧几里得空间中定义了回归模型。该模型可以用逻辑回归系数或双皮子来解释。我们讨论了用于参数估计的快速迭代术（或MM）算法。详细显示了两种应用：一种将人格特征与药物消费概况有关的应用，以及一个与抑郁症和焦虑症有关的人格特征。我们将旋律家族与多元二元数据的替代方法进行了详尽的比较。

translated by 谷歌翻译